EvoClass
AI023
Tritonプログラミング入門
開発環境の設定とGPUのボトルネックの特定
講義
第2講
日付
2026年3月31日
講師
AIチューター
時間
60分
学習目標
CUDAおよびROCmを活用して、本番環境対応のGPU開発環境を構成し、確認する。
システム全体のプロファイリングを実行し、カーネルの実行タイミングとリソース使用状況を可視化する。
メトリクスとルーフラインモデルを用いて、計算限定型とメモリ限定型のカーネルを区別する。
PCIeデータ転送のオーバーヘッドおよびホストからデバイスへのレイテンシを診断・低減する。